In [9]:
from __future__ import division
import numpy as np
import pandas as pd
from scipy import stats
%matplotlib inline
import matplotlib.pyplot as plt
import seaborn as sns
from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = "all"
Есть ли связь между неграмотностью и рождаемостью? Для 94 стран, уровень неграмотности женщин в которых больше 5%, известны доля неграмотных среди женщин старше 15 (на 2003 год) и средняя рождаемость на одну женщину (на 2005 год).
illiteracy.txt
Чему равен выборочный коэффициент корреляции Пирсона между этими двумя признаками? Округлите до четырёх знаков после десятичной точки.
In [2]:
illiteracy = pd.read_csv('illiteracy.txt', delimiter='\t')
illiteracy.info()
In [4]:
illiteracy.describe()
illiteracy.head()
Out[4]:
Out[4]:
In [6]:
il_pearsonr = stats.pearsonr(illiteracy['Illit'], illiteracy['Births'])
print('Pearson correlation: %.4f' % il_pearsonr[0])
In [7]:
il_spearmanr = stats.spearmanr(illiteracy['Illit'], illiteracy['Births'])
print('Spearman correlation: %.4f' % il_spearmanr[0])
In [19]:
sns.jointplot('Illit', 'Births', illiteracy, kind="reg");